<?php
return [
	/**
	 * 爬虫名字
	 */
	'name'=>'妹子图',

	'domains'=>[
		'www.mzitu.com'
	],
	// 'log_show'=>false, //是否显示日志，默认false
	// 'log_file'=>'', //日志路径，默认是data/phpspider.log
	// 'log_type'=>'', //默认为显示所有类型日志，可选info,warn,error,debug
	// 'input_encoding'=>'', //输入编码 UTF-8,GB2312,为null则自动识别
	// 'output_encoding'=>'', //输出编码 UTF-8,GB2312,为null则自动识别
	// 'tasknum'=> 1, //同时工作的爬虫任务数  ,默认为1
	// 'multiserver'=> '', //多服务器处理 ，默认是false,需redis支持
	// 'serverid'=> '', //服务器id,多服务器处理 ，
	// 'save_running_state'=> '', //保存爬虫运行状态,默认是false,需redis支持
	// 'queue_config'=> '', //保存爬虫运行状态、多任务处理 和 多服务器处理 都需要redis队列来保存采集任务数据
	// 'proxy'=> '', //代理
	// 'interval'=> '', //爬虫爬取每个网页的时间间隔
	// 'timeout'=> '', //爬虫爬取每个网页的超时时间
	'max_try'=> 5, //爬虫爬取每个网页失败后尝试次数
	// 'max_depth'=> '', //爬虫爬取网页深度，超过深度的页面不再采集
	// 'max_fields'=> '', //爬虫爬取内容网页最大条数 0为不限制
	// 'user_agent'=> '', //浏览器类型 AGENT_ANDROID AGENT_IOS AGENT_PC AGENT_MOBILE
	// 'client_ip'=> '', //客户端ip 
	'export'=> [ //数据导出
		'type'=>'db',
		'table'=>'meizitu'
	], 
	'db_config'=> [ //数据库配置
		'host'  => '127.0.0.1',
        'port'  => 3306,
        'user'  => 'root',
        'pass'  => 'root',
        'name'  => 'meizitu',
	], 
	// 'domains'=> '', //定义爬虫爬取哪些域名下的网页, 非域名下的url会被忽略以提高爬取速度
	'scan_urls'=> [
		'https://www.mzitu.com'
	], //定义爬虫的入口链接
	'content_url_regexes'=> [
		'https://www.mzitu.com/\d+'
	], //定义内容页url的规则
	// 'list_url_regexes'=> '', //定义列表页url的规则
	'fields'=> [
		[
			'name'=>'title',
			'selector'=>"/html/body/div[2]/div[1]/h2",
			'required'=>true
		],
		[
			'name'=>'category',
			'selector'=>"/html/body/div[2]/div[1]/div[2]/span[1]/a",
			'required'=>true
		],
		// [
		// 	'name'=>'created_at',
		// 	'selector'=>"/html/body/div[2]/div[1]/div[2]/span[2]",
		// 	'required'=>true
		// ],
	], //定义内容页的抽取规则



];